看不懂的“绿坝”过滤词

13 06 2009年

    密歇根大学计算机安全专家破解了“绿坝”使用的过滤词列表。这个列表主要是一些色情和政治敏感词,虽然不像早先网上所传的那个列表那么离谱,但是仍有许多地方让人看不懂。

    一、该列表将“本质”、“歪理邪说”、“三级”、“裸露”、“同性恋”等常用词语也都列为过滤词。“歪理邪说”大概是政治敏感词,后面的三个大概算是色情词语,“本质”该算什么,就超出我的想象力了。我以前的非色情、非政治文章中出现过这些词,是否意味着登载我的这些文章的网站将被秒杀?而且,“绿坝”不仅监控上网,也监控写作,这是否意味着如果在用Word写作时出现这些常用词语,文章的草稿将被突然强行删掉,还不预先提醒你保存?是否意味着以后全国中小学生的作文中不能再出现“本质”等词,这些词语必须从课本、词典中删除?

    二、该列表有一个奇怪的词“梵欲”,闻所未闻,我还以为是什么新奇的色情词汇,但用google搜索了一下,含有这个词语的网页很少,仅有100多个,大多数是佛经网页,并没有一个是色情或政治敏感网页,为何会把这个莫名其妙的词列为过滤词?如果是输入时打错了字,如此应付一款打算给几亿人使用的软件,那也未免太草率了吧?

    三、不出所料,该列表的过滤词句大部分都与一个邪教组织有关,但是其中有很多是批判、攻击该邪教组织及其教主的,例如“法XX的反科学性质”、“法XX的反社会性质”、“法XX的歪理邪说”、“法XX煽动仇恨”、“法XX这个邪教”、“法XX这样一个非法组织”、“李XX是一个非常贪财的人”、“李XX培植帮凶”、“李XX欺骗信徒”、“李XX原形毕露”、“妖言惑众的李XX”等等。如果有网站还保留着当年政府发布的批判邪教的文章,是否也会被秒杀?为什么不让全国人民看到批判邪教组织及其教主的文章?莫非有轮子参与了该过滤词的编写?


操作

文章信息

38篇回复 to “看不懂的“绿坝”过滤词”

13 06 2009年
万物生长靠太阳 (12:56:08) :

好可惜是美国专家在做着这个工作 , 某部曰(或将曰):这是美帝国主义的别有用心 。

13 06 2009年
独角怪兽 (14:46:59) :

本人预测“绿坝”、“花季护航”马上也要成为过滤词了。

13 06 2009年
Nelson (16:23:36) :

本质:“看清某+0某+0教的邪+02教+02本质”。涉及罚0宫,好话坏话都不让说,就地和谐,不让讨论,和“李XX欺骗信徒”被就地正法是一样的。

13 06 2009年
准非医 (18:19:43) :

以后网上的“三级医院”或“三级甲等医院”的招牌也将被“秒杀”了。呵呵

13 06 2009年
scobleach (18:28:16) :

可能出现这些过滤词并不意味着被秒杀,而只是被记录到某个地方。

13 06 2009年
陈博 (19:06:42) :

这是这么多年来我第一次被我们亲爱的XXX逗的乐翻了。可以肯定的是,在这场闹剧过去之后,“绿坝”绝对会成为过滤词。

13 06 2009年
fuzzify (19:34:35) :

哈哈,有趣。
奥运会网站(含三级跳远)也未能幸免,而“软件版本质量”这些词汇也要遭殃了。

13 06 2009年
lonsoufi (20:26:58) :

再一次展现了我国和某小相邻兄弟国政府同样高深伟大的执政能力。

13 06 2009年
Metaverse (21:19:45) :

绿坝和化机护航恐怕会成为本年度最囧网络词汇之一,哈哈

13 06 2009年
iceberg (22:40:43) :

今天,你被“花季护航”了吗?–强国社区–人民网
http://www.people.com.cn/GB/32306/81152/9456987.html

14 06 2009年
吾皇万岁 (01:38:02) :

希望有身份有地位的人为了天朝的进步能勇敢的站出来。

14 06 2009年
ronaldfree (02:05:41) :

怎么能这样呢?还让不让人活了?要知道,现在上网成了很多人的一种生活方式,被绿坝这么一搞,跟吃了一只苍蝇的感觉一样。目前还没什么问题,就怕以后所有的计算机强制安装,希望这一天不要到来。

14 06 2009年
吴刚 (02:23:54) :

我还真不认为绿坝这东西是用来限制言论自由的,倒是这个软件的品质值得严重关注。
花这么多钱,搞这么个不伦不类的软件,充分反映出工信部的能力和水平。
做软件的人都知道国人写的软件往往都是粗制滥造,像这种有过滤功能的软件其实不要太多,为什么偏偏选中这款,招标过程值得探究。
至于过滤词多而烂,我想还是软件作者本着宁可错杀一千也不愿放过一个的心态放进去。其实也好理解,本身要通过关键字严格区分文章内容其实是不大可能的,如果招标过程中为了提高拦截率,那就会尽量放关键字进去。至于准确率那就可以相对下降了。就技术上来说,拦截色情图片和文字还是很有挑战的,这里的人基本不太讨论技术,看看上面的这些评论,都很外行,根本没有说到点子上。
老外的软件评测很快就能得出点有技术含量的东西,说明老外还是比这里要专业多的。

14 06 2009年
Sonic (03:29:37) :

The great firewall 已经是个很讨厌的东西了,现在又来个“绿坝”。老是给国内网民加各种各样紧箍咒,运营商的域名劫持等问题又没人去管。在国内上网真是憋气

14 06 2009年
墨西哥海鲜 (03:37:16) :

本质上来说,这个三级软件并非要禁止那些裸露出来的歪理邪说,它只是和有关部门的同性恋情结浓厚。

14 06 2009年
打酱油 (07:27:39) :

顶!!!!!!!!!!!!!!!!

14 06 2009年
今天你“绿霸”了没有 (08:19:05) :

其实,这种事多了,只是这个牵涉的网民太多了,所以受到关注,其实就是人大副委员长许嘉璐的得意门生弄得,谁知道是学生还是小三呢!!

14 06 2009年
zxhx (08:37:10) :

半年前还不知道工信部是啥,现在听起来简直是如雷贯耳,这下工信部可要出大名了!

14 06 2009年
ronaldfree (10:08:34) :

今天你“绿霸”了没有 (08:19:05) :

其实,这种事多了,只是这个牵涉的网民太多了,所以受到关注,其实就是人大副委员长许嘉璐的得意门生弄得,谁知道是学生还是小三呢!!
============================================
原来是许嘉璐这个政治投机商搞的啊!太恶心了。听说他以前学问做的很好的,好好的学问不做,非要做政治婊子。这个家伙年纪应该很大了,怎么还不死呢?!

14 06 2009年
网游甲 (10:42:33) :

有什么看不懂的,这后面肯定有他妈的幕后交易,利用“国家安全”搞钱,兼靠挞中国人。

14 06 2009年
网游甲 (10:44:28) :

另,这个玩意根本就是小儿科的东西,哪里需要“密歇根大学计算机安全专家破解”呀,你电脑太外行了吧?以前的电驴过敏字列表,都被中国十几岁的小孩解密过,很简单的事儿。

14 06 2009年
方舟子 (10:58:24) :

这个“网游甲”,什么都看得懂。这个“网游甲”还真内行,加密的东西,再简单也是需要破解的。

14 06 2009年
ZATE (18:25:28) :

方先生,这个网友甲朋友到也没说全错

这款价值4000W的软件,绝对是幕后交易在其作用,因为质量实在过于低劣。简直让人梦回清末

当然他说十几岁的小孩破解夸张了,但十几岁懂点计数机确实能专杀掉这个软件,360都能轻松灭了他

我本人也不反对使用软件禁止未成年人浏览网上的一些内容,但不会使用这种垃圾软件

14 06 2009年
14 06 2009年
cc (22:46:09) :

这更多的是一种商业行为。

14 06 2009年
方舟子的商业行为 (23:50:32) :

方舟子,你生活在太空码?中国的时代不需要一步一步走进现代化,直接就飞到现代化码?你的一张破嘴,放尽了无用的废气,也只不过是给自己出了名。
首先,绿坝是出于网络安全的考虑。在我们这样一个发展中的国度人口多,问题多,如果使用绿坝,能防止很多像你这样丧心病狂的人,无端地攻击一些正常的事物。
其次,或许你的学术打假能打到一些“坏人”,但是你对学术也全无贡献,怎么好意思总是做警察,而不出业绩呢?
第三,中医的东西你完全不懂,西药把副作用写在纸上,中药并不是无副作用的,只是大多比较微小。中医和西医的目的都是治病救人,并不分孰优孰劣。只不过西医发展到今天使用了器械,而中医名医的手法失传了。而中医的调理作用明显优于西医,你是个卖西药的瞎郎中,在这里狂吠。
作为一个普通大众,我发现你既无什么学术精神,也没有真才实学,我想你一天忙碌下来,除了感到自己很无聊以外,就是想看着别人的痛苦开心,只是这些年这些快乐少了,因为大家发现真正无知的是你!

15 06 2009年
aliceshengnv (00:05:25) :

呵呵呵

15 06 2009年
小老百姓 (01:14:40) :

楼上那个叫“方舟子的商业行为”的,希望你能静下心来,不要狂躁。“理”需要讲才能明,着急没用,骂人更没用,骂人只能使自己掉价,被人看不起。绿坝也好、中医也好,自己不争气还不许别人说吗?我看你这个人是不是还在梦里?“中医名医的手法”失传什么了?是不是一时半会儿找不回来了?别着急,没关系,既然丢了着急也没用,节哀吧。可是还是一定要记住:
1 科学总是会向前发展的,不会倒退,我们向后看过之后要向前看。
2优胜劣汰,这是谁也无法扭转的自然规律(无论是你还是方舟子都无法扭转)
3便宜没好货,好货不便宜(轻易得到的东西往往靠不住,包括中医、也包括绿坝)

15 06 2009年
老猫 (03:49:10) :

滤霸!

16 06 2009年
whatistrue (13:07:06) :

那些叫骂的甭去理会。是不是“残废”正常人都能看出来。 :)
这个驴巴这种搞法,是逼得小百姓们开倒车,回去用刀版的东东,甭管你预装的什么,拿到手的第一件事就是格。从零开始。 :)

16 06 2009年
付强 (17:49:41) :

防民甚于防寇啊!

17 06 2009年
China: Censored keywords-Danwei « FACT – Freedom Against Censorship Thailand (03:35:42) :

[…] Fang Zhouzi’s blog (Chinese): Green Dam’s baffling filtered words […]

18 06 2009年
(10:10:23) :

绿坝这样的笑话都有人来辩护, 真是可笑; 中医这种神话传说到现在还有信徒, 真是可悲.
伟大的D没搞好教育就把互联网接好了, 害得自己整天琢磨如何防民之口, 害得我看看文章还得听几声狗吠

18 06 2009年
芸珜 (10:14:01) :

网游甲 (10:44:28) :

另,这个玩意根本就是小儿科的东西,哪里需要“密歇根大学计算机安全专家破解”呀,你电脑太外行了吧?以前的电驴过敏字列表,都被中国十几岁的小孩解密过,很简单的事儿。
========================
确实很简单,原本以为绿坝的dat文件用的是类似Base64的编码,因为文件中用到有64个字符(另有回车符、换行符)。后来发现不是这样,解码只需两个字符的低4位合成一个字节与0xCC异或,高4位根本没用。
电驴的过滤词文件用的就是通用的Base64编码,更没难度。

19 06 2009年
美人他爹 (17:17:51) :

原来本质是过滤词。原来绿坝的作用就是打算让人看不到本质。原来如此

27 06 2009年
小二黑 (05:04:28) :

首先,绿坝是出于网络安全的考虑。在我们这样一个发展中的国度人口多,问题多,如果使用绿坝,能防止很多像你这样丧心病狂的人,无端地攻击一些正常的事物。

嗯嗯,我们都是丧心病狂的,就你是正常的——僵尸,对吧朋友。

29 07 2009年
宙斯盾 (01:40:16) :

拜托,有点儿脑子好不好,中国国内搞网络安全的,你看他出什么产品,往往价格越高的越白痴

一个 freeware 的防火墙,改改 copyright,重新编译一下,做个中文网页街面,放工控机上,那就是什么什么防火墙,十几万人民币,不买这个不行,因为“网络安全是重中之重”;买思科的也不行,因为“没有自主知识产权”;nnd 网络安全不指望它,你倒是别给 lz 添乱呀,访问量稍大它老先生自己死过去了,顺便阻止了 lz 对所有网络设备的访问,这就是所谓的“千兆线速”。只能跑机房给他 reset,有时候刚 reset 完跑回来,它老先生又死了,真拿哥们当中国足球队的使唤,让咱练折返跑?

现在这个白痴又出了改进版,大概是充分领教了大家的抱怨,人家来了个“峰流卸载”,意思就是流量一大,它自己处理不了,干脆就不过滤了,等你流量下来再说:这是精神正常的人说的话吗?不明摆着邀请别人对你 DOS 攻击?

至于说关键词过滤,纯属白痴,基本原理就是错误的,难道说这人非觉得根据几个“关键词”就能代表文章的内容、倾向?

我给方先生提个伟大的建议,建议这个绿霸最好还是给生化专业的学生专用,加入一些关键词之后,把生化专业论文都用绿霸过滤一遍再给学生看。

大家知道,现在搞生化最需要想象力,如果猜测准确那可真是省不少钱、省不少事。事实证明,经绿霸培养,想象力和猜测准确度真不是一般的高。我常看网络小说,以前见到 ** 总要根据上下文揣摩半天,现在一见到“中**军”“法**军”就知道,那不过是”中-国-军-队”之类的

如果我从上中学就开始用绿霸,搞不好蛋白质结构分析这方面,每个月都能出一篇CSI论文,早学部委员了……

27 08 2009年
YJ (01:47:17) :

没办法 不是说过么 矫枉必得过正…

只能说是制度问题了。摊手。

留言

您可以用这些标签 : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

CAPTCHA Image
*